ডিস্ট্যান্স মেট্রিক্স মেশিন লার্নিং এবং ডেটা সায়েন্সে বিভিন্ন পয়েন্ট বা ভেক্টরের মধ্যে দূরত্ব পরিমাপ করতে ব্যবহৃত হয়। এটি বিভিন্ন এলগরিদমে যেমন ক্লাস্টারিং, শ্রেণীবদ্ধকরণ, এবং কনটিনিউয়াস বা ক্যাটেগোরিক্যাল ডেটার মধ্যে সম্পর্ক নির্ধারণে ব্যবহৃত হয়।
এখানে Euclidean Distance এবং Manhattan Distance দুটি প্রচলিত দূরত্ব পরিমাপের পদ্ধতি নিয়ে আলোচনা করা হবে।
১. ইউক্লিডিয়ান ডিস্ট্যান্স (Euclidean Distance)
ইউক্লিডিয়ান ডিস্ট্যান্স হলো দুটি পয়েন্টের মধ্যে সরল (স্ট্রেইট) লাইন দ্বারা পরিমাপিত দূরত্ব, যা পিথাগোরাস থিওরেম এর ভিত্তিতে গণনা করা হয়। এটি সাধারণত দুটি পয়েন্টের মধ্যে সরলরেখার দূরত্ব পরিমাপ করতে ব্যবহৃত হয়।
ফর্মুলা:
এটি সাধারণত দুটি পয়েন্ট এবং এর মধ্যে পরিমাপ করা হয়:
এটি দুই মাত্রিক (2D) পয়েন্টের জন্য, তবে তিন বা তার বেশি মাত্রিক পয়েন্টের জন্যও এটি প্রয়োগযোগ্য। 3D বা -ডি স্পেসে, ফর্মুলা হবে:
উদাহরণ:
ধরা যাক দুটি পয়েন্ট:
- পয়েন্ট A (3, 4)
- পয়েন্ট B (6, 8)
তাদের ইউক্লিডিয়ান ডিস্ট্যান্স হবে:
বৈশিষ্ট্য:
- এটি সরলরেখার বা "স্ট্রেইট-লাইন" দূরত্ব পরিমাপ করে।
- সর্বাধিক ব্যবহৃত ডিস্ট্যান্স মেট্রিক্স এবং কনটিনিউয়াস ডেটার জন্য আদর্শ।
- সাধারণত, কনটিনিউয়াস বা নিরবচ্ছিন্ন বৈশিষ্ট্যের মধ্যে সম্পর্ক নির্ধারণের জন্য ব্যবহার করা হয়।
২. মানহাটান ডিস্ট্যান্স (Manhattan Distance)
মানহাটান ডিস্ট্যান্স হলো দুটি পয়েন্টের মধ্যে অনুভূমিক এবং উল্লম্বভাবে চলার মাধ্যমে পরিমাপিত দূরত্ব, অর্থাৎ এটি কোনো "ব্লক"-এ চলার মতো এবং এটি সোজাসুজি (স্ট্রেইট) চলার পথে নয়, বরং মাত্রিক অক্ষরেখা বরাবর চলার মাধ্যমে পরিমাপ করা হয়। এই পদ্ধতি মূলত গ্রিড বা রাস্তার মতো কাঠামোয় ব্যবহৃত হয় যেখানে পয়েন্ট দুটি একে অপরের প্রতি অনুভূমিক বা উল্লম্বভাবে মাপা হয়।
ফর্মুলা:
তিন বা বেশি মাত্রিক ক্ষেত্রে, দুটি পয়েন্ট এবং এর মধ্যে মানহাটান ডিস্ট্যান্সের ফর্মুলা হবে:
উদাহরণ:
ধরা যাক দুটি পয়েন্ট:
- পয়েন্ট A (3, 4)
- পয়েন্ট B (6, 8)
তাদের মানহাটান ডিস্ট্যান্স হবে:
বৈশিষ্ট্য:
- এটি অনুভূমিক এবং উল্লম্ব দূরত্ব পরিমাপ করে, অর্থাৎ পাথের মত চলা হয় (যেমন, রাস্তা ধরে চলা)।
- এটি যখন ডেটার মধ্যে একাধিক মাত্রার পার্থক্য থাকে, বিশেষত গ্রিডের মধ্যে, তখন অধিক কার্যকরী।
- কেবলমাত্র সোজা লাইন বা সোজাসুজি চলার ক্ষেত্রে ব্যবহার করা হয় না, বরং কিছু নির্দিষ্ট পাথ অনুসরণ করে পরিমাপ করা হয়।
ইউক্লিডিয়ান এবং মানহাটান ডিস্ট্যান্সের মধ্যে পার্থক্য:
| বৈশিষ্ট্য | ইউক্লিডিয়ান ডিস্ট্যান্স | মানহাটান ডিস্ট্যান্স |
|---|---|---|
| পথ | সরলরেখা (স্ট্রেইট লাইন) | অনুভূমিক এবং উল্লম্ব (Grid-like) |
| ফর্মুলা | ( d(P, Q) = \sum | |
| ব্যবহার | কনটিনিউয়াস ডেটা, 2D, 3D স্পেসে | গ্রিড বা রাস্তা-ভিত্তিক কাঠামো |
| তুলনামূলক | ছোট পরিসরে কম দূরত্ব পরিমাপ | সাধারণত বৃহৎ পরিসরে বেশি দূরত্ব পরিমাপ |
| প্রয়োগ ক্ষেত্র | স্পেস, ভেক্টর স্পেস, সিগনেচার | রাস্তা ম্যাপ, শহরের ব্লক, গ্রিডের অবস্থা |
উপসংহার:
- ইউক্লিডিয়ান ডিস্ট্যান্স সাধারণত সোজাসুজি (স্ট্রেইট) পথ পরিমাপের জন্য ব্যবহৃত হয়, যা কনটিনিউয়াস বা নিরবচ্ছিন্ন ডেটার মধ্যে ব্যবহৃত হয়। এটি সিগনেচার, গ্রাফ এবং ভেক্টর স্পেসে ব্যবহার করা হয়।
- মানহাটান ডিস্ট্যান্স অনুভূমিক এবং উল্লম্ব পথ পরিমাপ করে, এবং এটি গ্রিড ভিত্তিক কাঠামো বা রাস্তার মানচিত্রে ব্যবহৃত হয়।
এগুলো যথাযথভাবে ব্যবহার করা হলে, আপনার মডেল বা অ্যালগরিদম আরো নির্ভুল এবং কার্যকরী হতে পারে।
Read more